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L. RIASSUNTO 



Vengono descritte nuove proteine ricombinanti derivate dal 
riassortimento di dominii strutturali derivati dalle subunita 
a dei fattori di crescita HGF e/o MSP. 

Le proteine ricombinanti della presente invenzione sono dotate 
di attivita biologica, e proteggono le cellule dalla morte 
(apoptosi) indotta da farmaci chemioter apici . 

Pertanto, queste molecole possono essere convenientemente 
utilizzate per prevenire o curare gli effetti collaterali 
tossici del trattamento chemioterapico dei tumori . 
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C.AMPQ DELL 'INVENZIONE 3 0 fiEN. 1998 

La pre'sente invenzione si riferisce a proteine ricombinanti 
derivate dalla combinazione di dominii strutturali derivati delle 

I 

subunita a dei fattori di crescita HGF e MSP. 

In particolare, i fattori ingegnerizzati dell ' invenzione sono 
ottenuti per combinazione dei dominii HL ("harpin loop") e K 1 -K 4 
( "kr ingle" ) di entrambe le catene a di HGF e/o MSP, in maniera da 
ottenere una struttura avente due superdominii con interposta una 
seguenza "linker". Inoltre, 1' invenzione si riferisce a sequenze di DNA 
che codificano per le suddette proteine ricombinanti, a vettori di 
espressione comprendenti dette sequenze di DNA e alle cellule ospiti 

I 

contenenti tali vettori di espressione. 

Le proteine ricombinanti della presente invenzione sono 
dotate di attivita biologica, misurabile mediante la 
determinazione dell'effetto "scattering" (vide infra), e proteggono 
le cellule dalla morte (apoptosi) indotta da farmaci 
chemioterapici . Pertanto, queste molecole possono essere 
convenientemente utilizzate per prevenire o curare gli 
effetti collaterali tossici del trattamento chemioterapico dei 
tumori . 
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rugoso, che indirizza il peptide neosintetizzato alia via secretiva. La 
catena £ contiene un "box" con sequenza omologa a quella tipica di una 
serina proteasi, ma non possiede nessuna attivita enzimatica ("Nakamura, 
T. et al., 1989, .Mature 342: 440-443"; "Han, S. et al., 1991, 
Biochemistry 30: 9768-9780"). Sia la catena a che quella f3 
contribuiscono al legame del fattore di crescita con il rispettivo 
recettore (Met per HGF e Ron per MSP). 

I polipeptidi HGF e MSP sono in grado di indurre una varieta di 
effetti biologici oltre alia prolif erazione cellulare. Le principali 
attivita biologiche di queste molecole sono le seguenti: stimolo del la 
divisione cellulare (mitogenesi ) ; stimolo della motilita ("scattering"); 
induzione della polar izzazione e del dif f erenziamento cellulare; 
induzione della formazione di tubuli all'interno di una matrice di 
collagene ( morf ogenesi ) ; incremento della soprawivenza cellulare 
(protezione da apoptosi). I tessuti che rispondono alia stimolazione con 
HGF e MSP sono tutti quelli le cui cellule esprimono i rispettivi 
recettori Met (HGF) e Ron (MSP). I piu importanti tessuti bersaglio di 
questi fattori sono le cellule epiteliali di diversi organi quali il 
fegato, il rene, il polmone, la maramella, il pancreas e lo stomaco, e 
alcune cellule del sistema ematopoietico e nervoso. Una descrizione 
dettagliata degli effetti biologici di HGF e MSP nei vari tessuti si 
trova in "Tamagnone, L. & Comoglio, P., Cytokine & Growth Factor 
Reviews, 1997, 8: 129-142, Elsevier Science Ltd."; "Zarnegar, R. & 
Michalopoulos , G. , 1995, J. Cell Biol. 129: 1177-1180"; "Medico, E. et 
al., 1996,. Mol. Biol. Cell, 7: 495-504"; "Banu, N. et al., 1996, J. 
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mostrato nell'esempio 3. Nel caso dell' MSP, i siti di interazione con il 

recettore Ron sono meno chiari: alcuni studi preliminari suggeriscono 
che la situazione sia opposta rispetto a quella dell' HGF, owero che sia 
la catena 13 a legare direttamente il recettore mentre la catena a 
avrebbe la funzione di stabilizzare il complesso ("Wang, M. et al . , 
1997, J. Biol. Che/77. 272: 16999-17004"). 

L'uso terapeutico di molecole quali HGF e MSP e potenzialmente 
indicato in una vasta gamma di patologie ("Abdulla, S. , 1997, Mol. Med. 
Today 3: 233"). Tuttavia, numerose complicazioni sia di carattere 
tecnico sia di ordine biologico rendono 1 1 applicazione di queste 
molecole in campo clinico problematica. Prima di tutto, il carattere 
pleiotropico di questi fattori pud essere causa di risposte biologiche 
poco selettive e quindi pud generare effetti collaterali non 
desiderabili. Ad esempio, a stato suggerito l'uso di HGF per prevenire 
alcuni effetti collaterali di farmaci chemioterapici come il cisplatino 
(Kawaida, K. et al. , 1994, Proc. Nat. Acad. Sci. USA '91 : 4357-4361 ) . Nei 
pazienti affetti da cancro trattati con questo farmaco si puo verificare 
un danno renale acuto dovuto all'azione citotossica del cisplatino sulle 
cellule epiteliali del tubulo prossimale. L'HGF e in grado di proteggere 
queste cellule dalla morte programmata (apoptosi) indotta dal 
cisplatino, ma al tempo stesso puo indurre la prolif erazione 
indesiderata di cellule neoplastiche . Altri problemi legati all'uso 
farmaceutico di HGF e MSP sono la necessita di attivazione proteolitica 
e la stabilita delle molecole, che possono comportare complicazioni di 
ordine tecnico. Le forme tronche NK1 e NK2 di HGF non presentano i 
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[A] rappresenta la sequenza (LS) m -HL-K 1 -(K 2 ) n -(K3)o-(K4)p 

dove (le numerazioni degli arraninoacidi che seguono vanno riferite alle 

sequenze di HGF e MSP come riportate rispettivamente in Fig. 1 e 2): 

LS corrisponde all 1 intervallo di sequenza araminoacidica 1-31 di HGF o 

all ' intervallo di sequenza 1-18 di MSP; 

HL corrisponde ad un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra (o uguale a) gli amminoacidi 32 e 70, 
I'altro estremo compreso tra (o uguale a) gli amminoacidi 96 e 127; 
oppure corrisponde ad un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 19 e 56, 
I'altro estremo compreso tra (o uguale a) gli amminoacidi 78 e 109; 
Kjl corrisponde a un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra (o uguale a) gli amminoacidi 97 e 128, 
I'altro estremo compreso tra (o uguale a) gli amminoacidi 201 e 205; 
oppure corrisponde ad un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 79' e 110, 
I'altro estremo compreso tra (o uguale a) gli amminoacidi 186 e 190; 
K 2 corrisponde ad un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra (o uguale a) gli amminoacidi 202 e 206, 
I'altro estremo compreso tra (o uguale a) gli amminoacidi 283 e 299; 
oppure corrisponde ad un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 187 e 191, 
I'altro estremo compreso tra (o uguale a) gli amminoacidi 268 e 282; 
K 3 corrisponde ad un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra (o uguale a) gli amminoacidi 284 e 300, 
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l'altro estremo corapreso tra (o uguale a) gli amminoacidi 378 e 385; 
oppure corrispende a un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 268 e 283, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 361 e 369; 
K 4 corrisponde ad un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra (o uguale a) gli amminoacidi 379 e 386, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 464 e 487; 
oppure corrisponde ad un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 362 e 370; 
1 ' altro estremo compreso tra ( o uguale a ) gli amminoacidi 448 e 481 ; 
m, n, o, p sono scelti tra 0 e 1; 

la somma n+o+p e un numero intero compreso tra (o uguale a) 0 e 3, con 
la condizione che n > o > p; 

Be la sequenza [{x) q Y] r , dove X = Gly e Y = Ser, Cys, Met, Ala; 
q e un numero intero compreso tra (o uguale a) 2 e 8; 
r e un numero intero compreso tra (o uguale a) 1 e 9; A ; 

h 

[C] rappresenta la sequenza HL-K 1 -(K 2 ) s -(K3) t -(K4) u \t 
dove HL, K-L-K4 sono come definiti in .precedenza, 

s, t, u sono scelti tra 0 e 1; la somma s + t + u e un numero intero 
compreso tra (o uguale a) 0 e 3, con la condizione che s > t > u; 
D rappresenta la sequenza W-Z, dove W e un sito proteolitico 
convenzionale , Z una qualsiasi sequenza tracciante (tag) utile per la 
purif icazione e rivelazione della proteina; y e 0 o 1. 

Esempi non limitanti di W sono rappresentati da sequenze di consen- 
so per le proteasi enterochinasi , trombina, fattore Xa e proteasi IgA. 
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Tra le proteine di formula generale (I), sono preferite quelle in 
cui il dominio HL corrisponde ad una sequenza della catena a di HGF 
compresa tra (o uguale a) gli amminoacidi 32 e 127, o ad una sequenza 
della catena a di MPS compresa tra (o uguale a) gli amminoacidi 19 e 98; 
il dominio K-j_ corrisponde ad una sequenza della catena a di HGF compresa 
tra (o uguale a) gli amminoacidi 128 e 203, o ad una sequenza della 
catena a di MPS compresa tra (o uguale a) gli amminoacidi 99 e 188; il 
dominio K 2 corrisponde ad una sequenza della catena a di HGF compresa 
tra (o uguale a) gli amminoacidi 204 e 294, o ad una sequenza della 
catena a di MPS compresa tra (o uguale a) gli amminoacidi 189 e 274; il 
dominio K3 corrisponde ad una sequenza della catena a di HGF compresa 
tra (o uguale a) gli amminoacidi 286 e 383, o ad una sequenza della 
catena a di MPS compresa tra (o uguale a) gli amminoacidi 275 e 367; il 
dominio K4 corrisponde ad una sequenza della catena a di HGF compresa 
tra (o uguale a) gli amminoacidi 384 e 487, o ad una sequenza della 
catena di MPS compresa tra (o uguale a) gli amminoacidi 368 e 477. 

Tra le possibili combinazioni dei dominii secondo la formula 
generale (I), sono preferite le seguenti (II) e (III), relative a due 
fattori ricombinanti denominati rispettivamente Metron Factor-1 e Magic 
Factor-1 : 

LS MS p-HL MS p-K 1MS p-K 2MSp -L-HL HGF -K 1HGF -K 2HGF -D ( Metron Factor-1 ) (II) 
e 

LS HGF -HL HGF -K 1HGF -K 2HGF -L-HL HGF -K 1HGF -K 2HGF -D ( Magic Factor-1 ) (III) 
Per entrambe le molecole, L rappresenta un "linker" di sequenza 
(Gly4Ser)3, D una sequenza tracciante "tag" Asp 4 -Lys-His5 . 
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Per il Metron Factor-1, LS MSP corrisponde alia sequenza 1-18 di 
MSP, HL MSP alia sequenza 19-56 di MSP.. K 1MSP alia sequenza 99-188 di 
MSP, K 2MSP alia sequenza 189-274 di MSP, HL HGF alia sequenza 32-127 di 
HGF, K 1HGF alia sequenza 128-203 di HGF, K 2HGF alia sequenza 204-294 di 
HGF . 

Per il Magic Factor-1, HL HGF , K 1HGF , K 2H gf sono come definiti 
sopra, LS HGF corisponde alia sequenza 1-31 di HGF. 

Le molecole ibride dell ' invenzione sono preparate con tecniche di 
ingegneria genetica secondo una strategia che prevede le seguenti fasi: 

a) costruzione del DNA codificante per la proteina d ' interesse ; 

b) inserimento del DNA in un vettore d* espressione; 

c) trasformazione di una cellula ospite con il DNA ricombinante (rDNA); 

d) coltura della cellula ospite trasformata in modo da esprimere la 
proteina ricombinante; 

e) estrazione e purif icazione della proteina ricombinante prodotta. 

Le sequenze di DNA corrispondenti ai dominii strutturali di HGF o 
di MSP possono essere ottenute per sintesi o a partire dai DNA 
codificanti per i due fattori naturali. Per esempio, si puo operare uno 
screening di librerie di cDNA utilizzando opportune sonde, in modo da 
isolare i frammenti di cDNA di HGF o di MSP contenenti i dominii che 
costituiscono la proteina ricombinante, oppure si pud utilizzare cDNA 
ottenuto da mRNA purif icato da opportune linee cellulari, per 
trascrizione inversa, o ancora il cDNA puo essere tagliato da plasmidi 
o, in generale, vettori che contengono le sequenze di HGF o MSP. 

I cDNA codificanti per i frammenti delle catene a di HGF e MSP pos- 



• • • * » • •••••• •• •• 

*• •• • • • » • • • » • • 

• * • • ••» • • ». • • • 

-12-! Bianche*ttj_ * Irftcco • fIi«io>a« 

• B3anck&fc.ti*j6ius§pp%.§£* alti;^* 

sono essere amplificati per PCR ("Mullis, K.B. e Faloona, F.A., Methods 
in Enzymol. 155 (1987) 335-350"), ed i prodotti di amplif icazione ricom- 
binati sfruttando opportuni siti di restrizione, presenti naturalmente 
nelle sequenze dei fattori oppure introdotti artif icialmente nella 
sequenza degli oligonucleotidi utilizzati per 1 1 amplif icazione . 

In maggior dettaglio, una delle strategie sopra menzionate pud 
essere la seguente: 

le porzioni di DNA che codificano per i dominii LS, HL, Kl, K2, K3 e K4 
vehgono amplif icate per PCR dai cDNA di HGF o MSP e quindi fatte 
ricombinare in modo da ottenere le sequenze ibride corrispondenti ad [A] 
e [C] . Come "primers" vengono utilizzate coppie di oligonucleotidi che 
riconoscono sequenze poste ai due estremi del dominio da amplif icare. I 

"primers" vengono disegnati in modo da contenere una sequenza che 
permetta la ricombinazione fra il DNA di un dominio e quello adiacente. 
Tale ricombinazione si puo effettuare per taglio endonucleasico e 

successiva reazione ligasica, oppure sfruttando la tecnica del la 

"recombinant PCi?" ("Innis, NA et al., in PCR Protocols, Academic Press, 

1990, 177-183"). 

La sequenza codif icante il dominio B ( "linker" ) puo essere ottenuta 
mediante la sintesi di un oligonucleotide a doppia catena, che si possa 
inserire fra [A] e [C] sfruttando opportuni siti di restrizione. 

I tre frammenti codif icanti per [A], [B] e [C] cosi ottenuti 
vengono quindi inseriti nella corretta sequenza in un opportuno vettore. 
In questa fase si puo decidere se aggiungere o meno in coda al frammento 
[C] il dominio D {"tag"), ottenuto per via sintetica analogamente al 
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dominio B. 

II vettore di espressione ricombinante puo contenere, oltre al 
costrutto ricombinante, un promotore, un sito di legame ai ribosoma, un 
codone di inizio, un codone di terminazione , eventualmente un sito di 
consenso per intensif icatori ("enhancer") di espressione. 

II vettore puo comprendere anche un marcatore per la selezione, per 
isolare le cellule ospiti contenenti il costrutto di DNA. Come vettori 
possono essere impiegati plasmidi di batter i come Escherichia Coli, di 
lievito, batteriofagi, virus, retrovirus, oppure puo essere utilizzat 
il DNA come tale. 

I vettori vengono clonati pref eribilmente in cellule bat|teriche, 
per esempio in Escherichia coli, come descritto in "Maniatis, Mo'lecular 
Cloning, Cold Spring Harbor Laboratory, New York, 1982", e le colonie 
possono essere selezionate per esempio per ibridazione con sonde 
oligonucleotidiche marcate con radioisotopi; successivamente , la 
sequenza del rDNA estratto dalle colonie positive viene determinata con 
metodi noti. 

II vettore con il costrutto ricombinante puo essere introdotto 
nella cellula ospite con il metodo della cellula competente [("J. Mol. 
Biol., 53, 154 (1970)"], il metodo del protoplasto ["PNAS, USA, 75, 1929 
(1978)"], il metodo del calcio fosfato ["Science, 221, 551 (1983)"] , il 
metodo DEAE-destrano ["Science, 215, 166 (1983)"], il metodo degli 
impulsi elettrici ["PNAS, 81, 7161 (1984)"], il metodo del "packaging" 
in vitro ["PNAS, 72, 581 (1975)"], il metodo del vettore virale ["Cell, 
37, 1053 (1984)"], il metodo di micro-iniezione ["Exp. Cell. Res., 153, 
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347 (1984)"], ed altri. 

Le cellule ospiti possono essere procariote od eucariote.. come 
batteri, lieviti o cellule di mammifero, e saranno tali da produrre 
ef f icacemente la proteina ricombinante . 

Dopo la trasformazione, le cellule vengono fatte crescere in un 
appropriate) terreno nutritivo, che pud essere per esempio MEM, DMEM o 
RPMI 1640 nel caso le cellule ospiti siano di mammifero. 

La proteina ricombinante viene seer eta nel terreno di coltura da 
cui pud essere recuperata e purificata con diversi metodi, come la 
cromatograf ia a esclusione di massa, d 1 adsorbimento , d'affinita, con il 
"salting-out", precipitazione , dialisi, ultraf iltrazione . 

Un sistema semplice e rapido per la produzione delle molecole 
dell ' invenzione e per esempio 1 ' espressione transiente in cellule di 
mammif ero . 

II plasmide scelto, per esempio PMT2 ("Sambrook, S. et al., Molecu- 
lar Cloning, Cold Spring Harbor Laboratory Press, 1989"), contenente il 
frammento di DNA ricombinante viene trasfettato in cellule recipienti 
appositamente predisposte, come Cos7 ("Sambrook, J. et al., supra" ) 
tramite la tecnica del calcio fosfato o altre tecniche equivalenti. 
Alcuni giorni dopo la trasfezione, il terreno condizionato delle cellule 
trasfettate viene raccolto, chiarificato per centrifugazione e 
analizzato il contenuto di fattore. Per questa analisi, si possono 
utilizzare anticorpi diretti contro HGF o MSP , oppure contro l'eventuale 
sequenza "tag": il surnatante viene immunoprecipitato e poi analizzato 
per "western blot" con lo stesso anticorpo. II surnatante contenente il 
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fattore ricombinante puo anche essere utilizzato direttamente per saggi 
biochimici e biologic! . La proteina puo essere purificata ad esempio 
sfruttando una sequenza "tag" di poli-istidina, tramite adsorbimento su 
di una colonna di resina al nichel e successiva eluizione con imidazolo. 

Le proprieta biochiraiche dei fattori ricombinanti dell ' invenzione 
sono state indagate in relazione alia loro capacita di attivare i 
recettori Met e Ron. 

Si e visto che concentrazioni sub-micromolari dei fattori inducono 
la fosforilazione in tirosina di Met in cellule epiteliali umane A549, 
mentre in cellule che esprimono Ron non inducono uno stato di 
fosforilazione al di sopra del basale. Nel complesso, gli esperimenti 
dimostrano che i primi due "kringle" di HGF mantengono la capacita di 
interagire ed attivare il recettore tirosin-chinasico Met, mentre i 
corrispondenti primi due "kringle" di MSP non sono sufficienti per 
modulare l'attivita catalitica del recettore Ron. Tuttavia, 
1 ' interazione con Ron, quantunque di bassa affinita, puo contribuire al 
reclutamento del fattore sulla superficie cellulare, svolgendo un ruolo 
analogo ai recettori a bassa affinita (di natura glicoproteica) che 
reclutano la molecola intatta di HGF attraverso il dominio che lega 
l'eparina. 

Per quanto riguarda l'attivita biologica, le molecole 
dell 1 invenzione possiedono una marcata attivita biologica, misurata con 
i test di "scattering", e di protezione delle cellule dall ' apoptosi 
indotta da cisplatino o etoposide. 

In particolare, si e visto che il surnatante contenente il fattore 
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ricorabinante promuove lo "scatter" di cellule epiteliali di varia natura 
fino a concentrazioni nanomolari. In questi saggi sono state usate 
cellule di epitelio renale (MDCK) o precursor i degli epatociti (MLP29). 

In un sistema sperimentale in vitro, in cui viene valutata la 
frammentazione del DNA tipica delle cellule apoptotiche {metodo TUNEL, 
Gavrieli, Y . et al. (1992), J. Cell. Biol. Ill, 493-501), i fattori 
ricombinanti proteggono dall' apoptosi indotta da agenti chemioterapici a 
livelli comparabili ad HGF e decisamente superiori a MSP. Le molecole 
ingegnerizzate sono risultate attive sulle cellule epiteliali primarie 
umane di tubulo prossimale (PTECs), su una linea di PTECs immortalizzata 
(Loc) e sui gia citati epatociti murini MLP29. 

Tra le applicazioni delle molecole ricombinanti dell ' invenzione, si 
possono citare: 

prevenzione della mielotossicita; in particolare, possono essere 
usate per l'espansione di progenitor i midollari, per incrementare la 
proliferazione dei precursori emopoietici o stimolarne la immissione 
in circolo; 

prevenzione della tossicita epatica, " renale e delle mucositi 
conseguenti a trattamenti antineoplastic!; in particolare i fattori 
ricombinanti possono essere usati per prevenire la tossicita 
(apoptosi) sugli elementi cellular i dif f erenziati del fegato, del 
rene e della mucosa del tratto gastroenteric© , e per stimolare gli 
elementi staminali della cute e delle mucose per permettere la 
rigenerazione degli strati germinativi; 
prevenzione della neurotossicita da chemioterapici. 
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Nel complesso, si possono citare i seguenti vantaggi legati 
alle proteine dell ' invenzi one . rispetto alle molecole parental.^ 
HGF e MSP: 

sono molecole piu piccole e dalla struttura piu compatta; 
sono piu stabili e si producono in maggiore quantita; 
non necessitano del taglio endoproteolitico di attivazione, che 
trasforma i precursori di HGF e MSP nelle rispettive forme attive; 
ingegnerizzando le molecole in combinazioni di dominii funzionali 
* diversi, si possono modulare gli effetti biologici, aumentando 
quelli favorevoli e riducendo que Hi indesiderati (per 
esempio, la protezione da apoptosi verso la prolif erazione 
cellulare ) . 

L'invenzione deve intendersi diretta anche alle sequence amroinoaci- 
diche e nucleotidiche riferite alia formula (I), recanti delle modifica- 
zioni, che per esempio possono derivare dalla degenerazione del codice 
genetico, pertanto senza che la sequenza amrninoacidica venga modificata, 
^o dalla delezione, sostituzione , inserzione, inversione o aggiunta di 
nucleotidi, e/o basi secondo tutti i possibili metodi noti nell"' arte. 

Inoltre, l'invenzione e estesa ai vettori d' espressione 
comprendenti una sequenza codificante per una proteina di formula 
generale (I), che, come detto, possono essere plasmidi, batteriof agi , 
virus, retrovirus, o altri, e alle cellule ospiti contenenti tali 
vettori d' espressione. 

Infine, l'invenzione e riferita all'uso delle proteine ricombinanti 
come agenti terapeutici, ed alle composizioni f armaceutiche contenenti 
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una quantita efficace delle proteine ricombinanti insieme ad eccipienti 
f armacologicamente accettabili . 

FlESfTRTZTONE DELLE FIGURE 

(Nella descrizione che segue "-His" posto dopo il nome dei fattori 
parentali, troncati o ricombinanti, o dei plasmidi, indica che le 
rispettive sequenze contengono il "tag" di poli-istidina) . 

Fig. 1: 

a) Sequenza nucleotidica e amminoacidica di HGF umano (Gene Bank # 
M73239; Weidner, K.M., et al. , 1991, Proc. Acad. Sci. USA, 88:7001- 
7005). A differenza della referenza citata, nella numerazione qui 
utilizzata il nucleotide No. 1 e la prima base del codone di inizio (la 
A del primo ATG). II primo amminoacido e la corrispondente metionina. Le 
regioni non tradotte al 5'e al 3' del cDNA non sono ne rappresentate , ne 
considerate nella numerazione. 

b) Sequenza nucleotidica e amminoacidica di MSP umano (Gene Bank # 
L11924; Yoshimura, T., et al. , 1993, J. Biol. Chem. , 268:15461-15468). A 
differenza della referenza citata, nella numerazione utilizzata nel 
presente documento il nucleotide No. 1 e la prima base del codone di 
inizio (la A del primo ATG). II primo amminoacido e la corrispondente 
metionina. Le regioni non tradotte al 5' e al 3' del cDNA non sono ne 
rappresentate ne considerate nella numerazione. 

Fig. 2: 

a) Struttura molecolare del Metron Factor-1. La leader sequence viene 
rimossa dalle cellule utilizzate per la produzione prima della 
secrezione ed e quindi assente dalla molecola matura. II "tag" di 
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poliistidina pud essere rimosso tramite digestione con la proteasi 
enterochinasi . 

b) Sequenza nucleotidica e amminoacidica del Metron-Factor-1 . La 
sequenza nucleotidica inizia con il sito EccRI e termina con il sito 
Sail (prime sei basi ed ultime sei basi, rispettivamente). II codone di 
inizio (ATG) e il codone di terminazione (TAG) sono sottolineati . 
Fig. 3: 

a) Struttura molecolare del Magic Factor-1. La leader sequence viene 
rimossa dalle cellule utilizzate per la produzione prima della secre- 
zione ed e quindi assente dalla molecola matura. II tag di poli-istidina 
puo essere rimosso tramite digestione con la proteasi enterochinasi. 

b) Sequenza nucleotidica e amminoacidica del Magic Factor-1 . La 
sequenza nucleotidica inizia con il sito Sail (prime sei basi e ultime 
sei basi, rispettivamente). II codone di inizio (ATG) e il codone di 
terminazione (TAG) sono sottolineati. 

Fig. 4: Produzione di Metron F-l per trasfezione transiente in 
cellule di mammifero. I surnatanti condizionati da cellule BOSC 
trasfettate con il plasmide di controllo (CTRL) o con pRK7 -Metron F-l- 
His sono stati immunoprecipitati con un anticorpo policlonale anti-MSP e 
rilevati per "western blot" con lo stesso anticorpo. 

Fig. 5: Quantizzazione delle proteine ricombinanti tramite 
"western blot". (A) Le proteine sono state adsorbite su beads di 
Sepharose-A-eparina e rivelate con un anticorpo monoclonale anti- 
poliistidina. (B) Le proteine sono state immunoprecipitate con un 
anticorpo policlonale anti-MSP e rivelate con un anticorpo monoclonale 
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anti-poliist idina . 

Fig. 6: Saggio di "scattering" compiuto su cellule epiteliali di 
rene (MDCK) utilizzando le proteine ricombinanti ingegnerizzate prcdotte 
per trasfezione transiente. II contenuto in proteine e stato 
quantificato tramite "western blot" (vedi Fig. 5). (A) cellule non 
stimolate; (B) cellule stimolate con surnatante di controllo; (C) 
cellule stimolate con HGF-His ; (D) cellule stimolate con NK2-HGF-His; 
(E) cellule stimolate con Metron Factor-1; diluizione dei surnatanti: 



Fig. 7: Attivazione ( fosforilazione) del recettore Met da parte 
del fattore ibrido Metron Factor-1. Cellule epiteliali umane (A549) sono 
state stimolate con i surnatanti condizionati da cellule BOSC 
trasfettate con il plasmide di controllo (CTRL) o con pRK7-Metron_F-l- 
His (METRON F-l ) alle diluizioni indicate. I lisati cellular i delle 
cellule stimolate sono stati immunoprecipitati con un anticorpo 
monoclonale anti-Met e rivelati per "western blot" con un anticorpo 
monoclonale anti-fosfotirosina. 

■ Gli esempi di seguito riportati illustrano in maggior dettaglio 
1 ' invenzione . 



Ottenimento del costrutto ricombinante codificante per il Metron 

Factor-1 

II cDNA di HGF e stato ottenuto con la tecnica di RT-PCR ("Reverse 
Transcriptase PCR; in: Innis, M . A., et al., PCR Protocols, Academic 
Press, 1990, 21-27") da una linea cellulare di fibroblasti di polmone 
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umano (MRC5; "Naldini, L. et al., 1991, EMBO J. 10: 2867-2878"). II cDNA 
di MSP e stato ottenuto con la stessa tecnica da fegato umano ("Gaudino, 
G., et al., 1994, EMBO J. 13: 3524-3532"). 

II frammento corrispondente a LS-HL-K1-K2 di MSP e stato 
amplificato per PCR utilizzando il cDNA di MSP come "template" e i 
seguenti oligonucleotidi come "primers": 

PI (senso) />.P V ; HHESfisak*. 

5' CGCGCG GAATTC CACCATGGGGTGGCTCCCACTCCT 3' 
P2 (antisenso) 

5' CGCGCG CTCGAG GCGGGGCTGTGCCTCGGACCCGCA 3' 
in cui le sequenze palindromi sottolineate rappresentano i siti di 
restrizione per gli enzimi EcdBl (oligonucleotide PI) e Xhol 
(oligonucleotide P2). II prodotto di PCR e stato digerito con gli enzimi 
di restrizione £ccRI e Xhol e quindi purificato tramite elettrof oresi su 
gel di agarosio. 

II frammento corrispondente a HL-K1-K2 di HGF e stato amplificato 
per PCR utilizzando il cDNA di HGF come "template" e i seguenti 
oligonucleotidi come "primers" : 
P3 ( senso ) 

5' CGCGCGICTAG^GGGACAAAGGAAAAGAAGAAATAC 3' 
P4 (antisenso) 

5' cgcg<:gmgctttgtcagcgcatgttttaattgcac 3' 

in cui le sequenze palindromi sottolineate rappresentano i siti di 
restrizione per gli enzimi Xbal (oligonucleotide P3) e Hindll! 
(oligonucleotide P4). II prodotto di PCR e stato digerito con gli enzimi 



Biandfefcti • Efracoo •• *Mi«oje» 
Bj^vjc^llti Gj-jfsej?£fe ed.gtlttj. 

di restrizione Xbal e Hindlll e quindi purificato tramite elettroforesi 
su gel di agarosio. 

Per la sequenza corrispondente al "linker", sono stati sintetizzati 
i seguenti oligonucleotidi parzialmente complementari, che sono stati in 
seguito fatti appaiare per ottenere un frammento di DNA a doppia elica 
con estremita coesive: 
P5 (senso) 

5' TCGAGGGCGGTGGCGGTTCTGGTGGCGGTGGCTCCGGCGGTGGCGGTTCT 3' 
P6 (antisenso) 

5 ' CTAG AGAACCGCCACCGCCGGAGCCACCGCCACCAGAACCGCCACCGCCC 3 ' 

in cui le basi sottolineate rappresentano le sequenze compatibili con i 
siti di restrizione per gli enzimi Xhol (oligonucleotide P5) e Xbal 
(oligonucleotide P6). 

I tre frammenti di DNA cosi ottenuti sono stati subclonati 
nell'ordine appropriato nei siti EccRI- Hindlll del vettore di 
espressione pRK7 ("Gaudino, G. , et al., 1994, EMBO J . 13: 3524-3532"), 
ottenendo il plasmide ricombinante pRK7-Metron_Fl , contenente tutti i 
componenti del Metron Factor-1 esclusa la sequenza tracciante. 

Per 1 ' inserimento di questa sequenza, sono stati sintetizzati i 

seguenti oligonucleotidi parzialmente complementari, che sono stati in 

seguito fatti appaiare per ottenere un frammento di DNA a doppia elica 

con estremita coesive: 

P7 (senso) 

5 ' AGCT GACGACGACGACAAACACCACCACCACCACCACCACTAGG | GTCGAC | 3 ' 
P8 (antisenso) 
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5 ' AGCT | GTCGAC | CCTAGTGGTGGTGGTGGTGGTGGTGTTTGTCGTCGTCGTC 3 ' 
in cui le basi sottolineate rappresentano le sequenze corapatibili con il 
sito di restrizione per l'enzima Hindlll e le sequenze palindromi 
racchiuse in un tax rappresentano il sito di restrizione per l'enzima 
Sail. II frammento di DNA a doppia elica cosi ottenuto e stato inserito 
nel sito di restrizione Hindlll del plasmide ricombinante ottenuto alio 
step precedente (con distruzione del sito Hindlll e creazione del sito 
Sail ) , ottenendo il plasmide pRK7-Metron_Fl-His . 

Ese mpjo l b 
Produzione del Metron Factor-1 

II vettore d'espressione pRK7 contiene un promotore del gene 
"immediate-early" del citomegalovirus umano (CMV) e un sito di origine 
di replicazione episomale del virus a DNA SV40. Pertanto, questo 
plasmide si presta particolarmente per 1 1 espressione di proteine in 
cellule che esprimono il "large T antigen" del virus SV40, come le 
cellule di epitelio renale BOSC ("Sambrook, J. et al. , Molecular 
Cloning, Cold Spring Harbor Laboratory Press, 1989"). II Metron Factor-1 
puo essere quindi prodotto tramite trasfezione transiente del plasmide 
pRK7-Metron Fl-His in cellule BOSC. 

Per la trasfezione, 10 6 cellule per piastra da 100 mm di diametro 
vengono seminate al giorno 0 in 90% Dulbecco's Modified Eagle Medium 
(DMEM)-10% siero fetale bovino (10 ml/piastra). II giorno 1, le cellule 
vengono trasfettate con 10 pg/piastra di pRK7-Metron_Fl-His tramite 
lipofezione, utilizzando il protocollo fornito dalla ditta produttrice 
di lipofectina (Gibco-BRL). II giorno 2, il medium contenente il DNA 
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viene sostituito con medium fresco a basso contenuto di siero (99.5% 
DMEM-0.5% siero fetale bovino). II giorno 4 (48 ore dopo la fine della 
trasf ezione ) , il medium viene prelevato, chiarif icato per 
centrifugazione, e analizzato per il suo contenuto in Metron Factor-1. 

Questa analisi puo essere compiuta in modi diversi. Ad esempio, la 
proteina ricombinante presente nel surnatante chiarificato puo essere 
immunoprecipitata con un anticorpo anti-MSP e poi visualizzata tramite 
"western blot" con lo stesso anticorpo (Fig. 4). Nell 'esempio mostrato 
nella figura 4, 500 pi di surnatante (chiarificato per centrifugazione, 
tamponato in 25 mM HEPES e addizionato di cocktail di inibitori delle 
proteasi) sono stati immunoprecipitati (2 ore a 4° C) con 20 pi di 
"beads" di Sepharose-A (Pharmacia) coniugate covalentemente con 2 pi di 
siero di coniglio immunizzato contro la porzione N-terminale di MSP. Il 
"pellet" di "beads" e stato lavato 3 volte con 500 pi di tampone di 
lavaggio (20 mM HEPES pH 7.4; 150 mM NaCl; 0.1% Triton X-100; 10% 
glicerolo) e scaldato per 2 minuti a 90° C in 100 pi di tampone di 
Laemmli. Le proteine cosi eluite sono state separate per SDS-PAGE su un 
gel all '8% di BIS-acrilamide , trasf erite su membrana (Hybond-C; 
Amersham) e analizzate tramite western blot. Per questa analisi, come 
anticorpo primario e stato usato lo stesso siero di coniglio impiegato 
per 1 1 immunoprecipitazione con diluizione 1:1000 e come anticorpo 
secondario proteina A coniugata con la perossidasi (Amersham). La 
proteina A e stato evidenziata tramite ECL (Amersham) seguendo il 
protocollo fornito dalla ditta produttrice. 

Alternativamente , la proteina ricombinante puo essere 
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parzialmente purificata tramite adsorb imento su "beads" di Sepharose-A 
coniugate con eparina e successiva analisi per "western blot" 
utilizzando anticorpi diretti contro il "tag" di poliistidii 
(Fig. 5). 

Nell ' esempio mostrato nella figura 5, le "beads" (20 pi) d: 
Sepharose-A-eparina (Pierce) sono state incubate (4 ore a 4° G„) ; .con. 500 
pi di surnatante (chiarif icato per centrif ugazione , tamponato in ^5-~ntfr' 
HEPES e addizionato di cocktail di inibitori delle proteasi) in presenza 
di 500 mM NaCl, lavate con tampone apposito (500 mM NaCl; 20 mM HEPES pH 
7.4; 0.1% Triton X-100; 10% glicerolo) e scaldate per 2 minuti a 90° C 
in 100 yl di tampone di Laemmli. Le proteine cosi eluite sono state 
separate per SDS-PAGE su un gel all '8% di bis-acrilamide , trasferite su 
membrana (Hybond-C; Amersham) e analizzate tramite "western blot". Per 
questa analisi, come anticorpo primario e stato usato un anticorpo 
monoclonale di topo contro la poliistidina (Invitrogen) diluito 1:5000 e 
come anticorpo secondario un anticorpo ovino anti-IgG di topo coniugato 
con la perossidasi (Amersham). L ! anticorpo secondario e stato 
evidenziato tramite ECL (Amersham) seguendo il protocollo fornito dalla 
ditta produttrice. 

La procedura di adsorbimento su beads di eparina puo essere 
utilizzata anche come protocollo di semi-pur ificazione della proteina 
ricombinante . In aggiunta, la molecola puo essere addizionalmente 
purificata sfruttando I'affinita della poliistidina per i metalli 
pesanti quali il nichel. La proteina contenente il "tag" di poliistidina 
puo essere adsorbita su di una colonna di resina al nichel (Invitrogen) 
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e success ivamente eluita con imidazolo {il protocollo dettagliato e 
f ornito dalla ditta produttrice ) . 

Esempio 2a 

Ottenimento del costrutto ricombinante codificante ger — il — Maaic 

Factor-1 " " " 

Come DNA di partenza sono stati utilizzati il cDNA di HGF e il 
plasmide pRK7-Metron_Fl-His descritto in precedenza. 

II frammento corrispondente a LS-HL-K1-K2 di HGF e stato 
amplificato per PCR utilizzando il cDNA di HGF come template e i 
seguenti oligonucleotidi come primers: 
P9 (senso) 

5' CGCGCGGGMICCGCCAGCCCGTCCAGCAGCACCATG 3' 
P10 (antisenso) 

5' CGCGCGAAGCTTTGTCAGCGCATGTTTTAATTGCAC 3' 

in cui le sequenze palindromi sottolineate rappresentano i siti di 
restrizione per gli enzimi BanHI (oligonucleotide P9) e Hindlll 
(oligonucleotide P10). II prodotto di PCR e stato digerito con gli 
enzimi di restrizione BanHI e Hindlll e *'quindi purificato tramite 
elettroforesi su gel di agarosio. 

Per la sequenza corrispondente al "linker", sono stati sintetizzati 
i seguenti oligonucleotidi parzialmente complementari , che sono stati in 
seguito fatti appaiare per ottenere un frammento di DNA a doppia elica 
con estremita coesive: 
Pll (senso) 

5' AGCTTCGGGCGGTGGCGGTTCTGGTGGCGGTGGCTCCGGCGGTGGCGGTTCT 3' 
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P12 (antisenso) 

5 ' CTAGAGAACCGCCACCGCCGGAGCCACCGCCACCAGAACCGCCACCGCCCGA 3 ' 
in cui le basi sottolineate rappresentano le sequenze compatibili con i 
siti di restrizione per gli enzimi Hindlll (oligonucleotide Pll) e Xbal 
(oligonucleotide P12). 

II frammento cosi ottenuto per PCR e la sequenza "linker" a doppia 
elica sono stati inseriti nel plasmide pRK7-Metron_Fl-His al posto del 
frammento EccRI-Xbal tramite un adattatore EcoRI-BanHI , ottenendo ii 
plasmide pRK7-Magic_Fl-His . 



Produzione del Maaic Factor-1 

II Magic Factor-1 viene prodotto in piccola scala per trasfezione 
transiente in cellule BOSC analogamente a quanto descritto per il Metron 
Factor-1. Per la semi-pur ificazione e rivelazione con anticorpi, viene 
adottata la tecnica di adsorbimento su "beads' 1 di Sepharose-A coniugate 
con eparina e successiva analisi per "western blot" utilizzando 
anticorpi diretti contro il "tag" di poliistidina (Fig. 5). 



Attivita bioloaica ("scattering" ) su c ellule eoiteliali. 

E' stato fatto un saggio motogenico {scattering) su cellule 
epiteliali di rene MDCK ad opera dei fattori HGF , NK2-HGF e Metron 
Factor-1. Per questo saggio funzionale, le cellule vengono piastrate al 
giorno 0 in piastre da 96 pozzetti (10 3 cellule/pozzetto) in 90% DMEM - 
10% siero fetale bovino. II giorno 1 il medium viene sostituito con 
terreno fresco tamponato con 50mM HEPES pH 7.4 e il surnatante 




Esempio 2b 



Esempio 3 
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contenente la proteina ricombinante viene addizionato alle diverse 
diluizioni. II giorno 2 le cellule vengono lavate con DPBS (Dulbecco's 
Phosphate Buffered Saline), fissate in 11% glutaraldeide, colorate con 
una soluzione di cristal-violetto e analizzate tramite microscopia. 
L' attivita di "scatter"' viene valutata osservando la morfologia delle 
colonie, che appaiono raggruppate nel controllo negativo (cellule non 
stimolate o stimolate con surnatante non contenente nessun fattore) e 
disperse nel controllo positivo (HGF-His). Anche la morfologia delle 
cellule stesse varia in seguito a stimolazione : infatti, come si puo 
osservare nella Fig. 6, le cellule stimolate con HGF-His e Metron 
Factor-1 assumono una forma piu allungata e fusiforme, caratterizzata da 
protuberanze della membrana cellulare denominate pseudopodi. Queste 
variazioni morfologiche sono la conseguenza dell ' attivazione da parte 
dei fattori di un programma genetico che prevede la modif icazione di una 
serie di parametri cellular i, quali la digestione della matrice 
cellulare da parte di proteasi specif iche e l'aumento della motilita. 

La tabella 1 riassume i risultati di diversi esperimenti ottenuti 
con i fattori HGF-His, NK2 -HGF-His e Metron Factor-1 sulle cellule MDCK. 
Le unita di "scatter" riportate indicano la diluizione massima del 
surnatante condizionato contenente il fattore, fino alia quale e 
possibile osservare attivita motogenica. I valori sono normalizzati per 
il contenuto di proteina determinato per "western blotting" come 
descritto sopra (vedi Fig. 5). Questi dati indicano che il fattore 
ibrido Metron Factor-1 possiede un' attivita di "scatter" 
approssimativamente tre ordini di grandezza superiore a quella della 
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forma tronca NK2-HGF-His e un ordine di grandezza superiore a quella del 
fattore parentale HGF-His. 

Tabella 1 
HGF-His NK2-HGF-His 
unita scatter 900 ± 29 6 ± 5 

Tabella 1: attivitadi "scatter" dei fattori HGF-His, NK2-HGF-His 
Metron Factor-1 misurata in cellule epiteliali di rene (MDCK). Le unita 
di "scatter" riportate indicano la diluizione massiina del surnatante 
condizionato contenente il fattore, fino alia quale e possibile 
osservare attivita motogenica. I valor i sono normalizzati per il 
contenuto di proteina determinato per "western blotting" . 

Esenroio 4 

Saoaio per la valutazione della urotezione dalla morte cellulare 
vroorammata (apoptosi). 

E 1 stato messo a punto un saggio funzionale in vitro che 
permette di valutare la percentuale di cellule apoptotiche 
trattate con cisplatino in presenza o assenza di un fattore di 
soprawivenza . 

Tale sistema si awale di una linea cellulare derivata da 
cellule epiteliali di tubulo prossimale di rene umano (LOC), 
immortal izzate attraverso 1 ' espressione ectopica del "large T 
antigen" del virus a DNA SV40. Per il saggio funzionale, le 
cellule vengono pias.trate al giorno 0 in piastre da 96 pozzetti 
(10 3 . cellule /pozzetto) in 90% DMEM - 10% siero fetale bovino. II giorno 
1, il terreno viene sostituito con un medium contenente 0.5% siero 
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f etale bovino tamponato con 50mM HEPES pH 7.4, a cui vengono aggiunte 
diverse diluizioni del surnatante contente il fattore ricombinante . Le 
cellule vengono pre-incubate con guesti fattori per 6 ore, e quindi 
incubate ulteriormente in presenza di lOug/ml cisplatino. II giorno 2, 
le cellule vengono lavate con DPBS e la percentuale di cellule 
apoptotiche viene valutata tramite la tecnica TUNEL (Boheringer 
Mannheim) . Lo stesso tipo di saggio puo essere svolto utilizzando 
colture primarie di cellule epiteliali umane di tubulo prossimale del 
rene (PTEC) . 

Questi esperimenti hanno permesso di determinare che il Metron 
Factor-1 possiede attivita di protezione da morte cellulare programmata 
indotta da cisplatino. 



ibrido Metron Factor-1 . 

E' stata analizzata l'abilita del Metron Factor-1 di indurre la 
fosforilazione in tirosina del recettore Met in cellule epiteliali umane 
(A549). 

Per questa analisi, una coltura al 90% della confluenza di cellule 
A549 in una petri da 100 mm di diametro e stata stimolata per 10 minuti 
con 1 ml di surnatante condizionato contenente il fattore Metron Factor- 
1 o nessun fattore (come controllo negativo) diluito 1:2.5 o 1:10 in 
DMEM. Dopo la stimolazione , le cellule sono state lavate in ghiaccio con 
PBS, lisate in 200 pi di soluzione di lisi (1% Triton X-100, 5 mM EDTA, 
150 mM NaCl, 20 mM Tris-HCl pH 7.4) addizionata di un cocktail di 



Esempio 5 



Induzione della fosforilazione in tirosina da parte del fattore 
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inibitori delle proteasi, immunoprecipitate per 2 ore a 4° C con 10 yl 
di beads di Sepharose-A coniugate covalentemente con un anticorpo 
monoclonale anti-Met ("Naldini, L. et al., 1991, EMBO J. 10: 2867- 
^878"), lavate 3 volte nella stessa soluzione di lisi, e scaldate a 90° 
C per 2 minuti per eluire le proteine adsorbite. Queste ultime sono 
state separate per SDS-PAGE su un gel all' 8% di BlS-acrilamide , 
trasferite su membrana (Hybond-C; Amersham) e analizzate tramite 
"western blot". Per questa analisi, come anticorpo primario e stato 
usato un anticorpo monoclonale di topo contro la fosfotirosina (UBI) 
diluito 1:10000 e come anticorpo secondario un anticorpo ovino anti-IgG 
di topo coniugato con la perossidasi (Amersham). L ' anticorpo secondario 
e stato evidenziato tramite ECL (Amersham) seguendo il protocollo 
fornito dalla ditta produttrice. La Fig. 7 mostra i risultati di questa 
analisi . . 
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R IVENPI CA Z I ONI 

1. Proteine ricombinanti caratterizzate dal fatto che la loro struttura 
comprende due superdominii, costituiti dalla combinazione dei dominii HL 
e K 1 -K 4 delle catene a di HGF e MSP , separati da una sequenza 
separatrice di legame ("linker"). 

2 . Proteine ricombinanti secondo la rivendicazione 1 , di formula 
generale { I ) : 

[A] - B - [C] - (D) y (I) 

in cui 

[A] rappresenta la sequenza (LS) m -HL-K^-(K2) n -(K3)Q-(K 4 )p 

dove ( le numerazioni degli amminoacidi che seguono vanno rif erite alle 

sequenze di HGF e MSP come riportate rispettivamente in Fig. 1 e 2): 

LS corrisponde all ' intervallo di sequenza amminoacidica 1-31 di HGF o 

all 1 intervallo di sequenza 1-1S di MSP; 

HL corrisponde ad un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra (o uguale a) gli amminoacidi 32 e 70, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 96 e 127; 
oppure corrisponde ad un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 19 e 56, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 78 e 109; 
K;l corrisponde a un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra (o uguale a) gli amminoacidi 97 e 128, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 201 e 205; 
oppure corrisponde ad un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 79 e 110, 
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l'altro estremo compreso tra (o uguale a) gli amminoacidi 186 e 190; 
K2 cor ri spend e ad un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra {o uguale a) gli amminoacidi 202 e 206, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 283 e 299; 
oppure corrisponde ad un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 187 e 191, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 268 e 282; 
K3 corrisponde ad un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra (o uguale a) gli amminoacidi 284 e 300, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 373 e 385; 
oppure corrisponde a un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 268 e 283, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 361 e 369; 
K4 corrisponde ad un intervallo di sequenza della subunita a di HGF 
avente un estremo compreso tra (o uguale a) gli amminoacidi 379 e 386, 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 464 e 487; 
oppure corrisponde ad un intervallo di sequenza della subunita a di MSP 
avente un estremo compreso tra (o uguale a) gli amminoacidi 362 e 370; 
l'altro estremo compreso tra (o uguale a) gli amminoacidi 448 e 481; ■ 
m, n, o, p sono scelti tra 0 e 1; / \ • 

la somma n+o+p e un numero intero compreso tra (o uguale a) 0 eS3,-_con' 
la condizione che n > o > p; -V 
B e la sequenza [(x)gY] r , dove X = Gly e Y = Ser, Cys, Met, Ala; 
q e un numero intero compreso tra (o uguale a) 2 e 8; 
r e un numero intero compreso tra {o uguale a) 1 e 9; 
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- 3 4; 

[C] rappresenta la sequenza HL-K]_-(K2 )s~( K 3 )t~( K 4 
dove HL, K-\-Ka sono come definiti in precedenza, 

s, t, u sono scelti tra 0 e 1; la somma n + o + p e un numero intero 
compreso tra (o uguali a) 0 e 3, con la condizione che s > t > u; 
D rappresenta la sequenza W-Z, dove W e un sito proteolitico 
convenzionale , Z una qualsiasi sequenza utile per la purif icazione della 
proteina su colonne di niche! o d'affinita; y puo essere 0 o 1. 

3. Proteine ricombinanti secondo le rivendicazioni 1-2, in cui il 
dominio HL corrisponde ad una sequenza della catena a di HGF compresa 
tra (o uguale a) gli amminoacidi 32 e 127, o ad una sequenza della 
catena a di MPS compresa tra (o uguale a) gli amminoacidi 19 e 98; il 
dominio corrisponde ad una sequenza della catena a di HGF compresa 
tra (o uguale a) gli amminoacidi 128 e 203, o ad una sequenza della 
catena a di MPS compresa tra (o uguale a) gli amminoacidi 99 e 188; il 
dominio K2 corrisponde ad una sequenza della catena a di HGF compresa 
tra (o uguale a) gli amminoacidi 204 e 294, o ad una sequenza della 
catena a di MPS compresa tra (o uguale a) gli amminoacidi 189 e 274; il 
dominio K3 corrisponde ad una sequenza della catena a" di HGF compresa 
tra (o uguale a) gli amminoacidi 286 e 383, o ad una sequenza della 
catena a di MPS compresa tra (o uguale a) gli amminoacidi 275 e 367; il 
dominio K4 corrisponde ad una sequenza della catena a di HGF compresa 
tra (o uguale a) gli amminoacidi 384 e 487, o ad una sequenza della 
catena di MPS compresa tra (o uguale a) gli amminoacidi 368 e 477. 

4. Proteine ricombinanti secondo le rivendicazioni 1-3 di formula (II): 
LS MSP -HL MS p-K 1MS p-K 2MS p-L-HL HGF -K 1HGF -K 2HGF -D ( Metron Factor-1 ) (II) 



in cui LS MS p corrisponde alia sequenza 1-18 di MSP, HL MS p alia sequenza 
19-56 di MSP , K 1MSp alia sequenza 99-188 di MSP, K 2MSp alla sequenza 
189-274 di MSP, HL HGF alla sequenza 32-127 di HGF , K 1HGF alla sequenza 
128-203 di HGF, K 2HGF alla sequenza 204-294 di HGF, 1 e la sequenza 
( Gly^Ser ) 3 , D e la sequenza Asp4-Lys-His5 . 

5. Proteine ricombinanti secondo le rivendicazioni 1-3 di formula 
(III): 

LS HGF -HL HGF -K 1HGF -K 2HGF -L-HL HGF -K 1HGF -K 2HGF -D { Magic Factor-1 ) (III) 
in cui HL HGF , KiHGF' K 2HGF' l> e D sono come definiti nella 
rivendicazione 4, LS HGF corisponde alia sequenza 1-31 di HGF. 

6. Sequenza nucleotidica codificante per le proteine ricombinanti delle 
rivendicazioni 1-5. 

7 . Vettori di espressione comprendenti le sequenze nucleotidiche della 
rivendicazione 6. 

8. Cellula ospite eucariota o procariota contenente un vettore 
d 1 espressione della rivendicazione 7. 

9. Uso delle proteine ricombinanti delle rivendicazioni 1-5 come agenti 
terapeutici . 

10. Composizioni f armaceutiche contenenti una quantita efficace delle 

proteine ricombinanti delle rivendicazioni 1-5, insieme ad eccipienti 

farmacologicamente accettabili. /C*^^ x \/- rT 7^ 

Milano, 30 gennaio 1998 ( y 
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FIGURA :3_<a. 

Ml 9 8 A 0 17 9 

ATGTGGGTGACCAAACTCCTGCCAGCCCTGCTGCTGCAGCATGTCCTCCTGCATCTCCTC 
! zr^= + + + + + + 60 

TACACCCACTGGTTTGAGGACGGTCGGGACGACGACGTCGTACAGGAGGACGTAGAGGAG 
1 MWVTKLLPALLLQ HVLLKLL 20 

CTGCTCCCCATCGCCATCCCCTATGCAGAGGGACAAAGGAAAAGAAGAAATACAATTCAT 

61 + + + + + + 120 

GACGAGGGGTAGCGGTAGGGGATACGTCTCCCTGTTTCCTTTTCTTCTTTATGTTAAGTA 

21LLPIAIP .YAEGQRKRRNTIH 40 

G AAT T C AAAAAAT C AG C AAAG AC T ACC C T AATC AAAAT AGATCCAGCACT G AAG AT AAAA 

121 + + + + + + 190 

CTTAAGTTTTTTAGTCGTTTCTGATGGGATTAGTTTTATCTAGGTCGTGACTTCTATTTT 

41 E FKKSAKTTLIKI DPALKI K 60 

ACCAAAAAAGTGAATACTGCAGACCAATGTGCTAATAGATGTACTAGGAATAAAGGACTT 

181 + + + + + + 240 

TGGTTTTTTCACTTATGACGTCTGGTTACACGATTATCTACATGATCCTTATTTCCTGAA 

61TKKVNTADQCANRCTRNKGL 80 

CCATTCACTTGCAAGGCTTTTGTTTTTGATAAAGCAAGAAAACAATGCCTCTGGTTCCCC 

241 + + + + + + 300 

GGTAAGTGAACGTTCCGAAAACAAAAACTATTTCGTTCTTTTGTTACGGAGACCAAGGGG 

81 PFTCKAFVFDKARKQCLWF? 100 

TTCAATAGCATGTCAAGTGGAGTGAAAAAAGAATTTGGCCATGAATTTGACCTCTATGAA 

301 -+ + + + + + 360 

AAGTTATCGTACAGTTCACCTCACTTTTTTCTTAAACCGGTACTTAAACTGGAGATACTT 

101 FNSMSSGVKKEFGHEFDLYE 120 

AACAAAGACTACATTAGAAACTGCATCATTGGTAAAGGACGCAGCTACAAGGGAACAGTA 

361 + + + + . + + 420 

TTGTTTCTGATGTAATCTTTGACGTAGTAACCATTTCCTGCGTCGATGTTCCCTTGTCAT 

121 NKDYIRNC I IGKGRSYKGTV 140 

TCTATCACTAAGAGTGGCATCAAATGTCAGCCCTGGAGTTCCATGATACCACACGAACAC 

421 + + + + + + 430 

AGATAGTGATTCTCACCGTAGTTTACAGTCGGGACCTCAAGGTACTATGGTGTGCTTGTG 

141SITKSGIKCQPWSSMIPHEK 160 
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AGCTATCGGGGTAAAGACCTACAGGAAAACTACTGTCGAAATCCTCGAGGGGAAGAAGGG 

481 + + + + + + 540 

TCGATAGCCCCATTTCTGGATGTCCTTTTGATGACAGCTTTAGGAGCTCCCCTTCTTCCC 

161 SYR GKDLQENYCRNPRGEEG 180 



541 
181 



GGACCCTGGTGTTTCACAAGCAATCCAGAGGTACGCTACGAAGTCTGTGACATTCCTCAG 

H + + + h + 

CCTGGGACCACAAAGTGTTCGTTAGGTCTCCATGCGATGCTTCAGACACTGTAAGGAGTC 



GPWCFTSN 



EVRYEVCD 



600 
200 



601 
201 



TGTTCAGAAGTTGAATGCATGACCTGCAATGGGGAGAGTTATCGAGGTCTCATGGATCAT 

+ h + + + (• 

ACAAGTCTTCAACTTACGTACTGGACGTTACCCCTCTCAATAGCTCCAGAGTACCTAGTA. 



CSEV ECMTCNGES 



R G L M D H 



660 
220 



ACAGAATCAGGCAAGATTTGTCAGCGCTGGGATCATCAGACACCACACCGGCACAAATTC 

661 + + + + + + 720 

TGTCTTAGTCCGTTCTAAACAGTCGCGACCCTAGTAGTCTGTGGTGTGGCCGTGTTTAAG 

221 TESGKICQRWDHQTPHRHKF 240 



721 
241 



TTGCCTGAAAGATATCCCGACAAGGGCTTTGATGATAATTATTGCCGCAATCCCGATGGC 

1 + H H + h 

AACGGACTTTCTATAGGGCTGTTCCCGAAACTACTATTAATAACGGCGTTAGGGCTACCG 



L P E R 



PDKGFDDNYCRNPDG 



CAGCCGAGGCCATGGTGCTATACTCTTGACCCTCACACCCGCTGGGAGTACTGTGCAATT MWEea®&»>'™ 

781 + + + + „ + + ^4 0:P^^jJ(H|(J 

GTCGGCTCCGGTACCACGATATGAGAACTGGGAGTGTGGGCGACCCTCATGACACGTTAA /-i <)M8B$^i>tJi 

261 QPRPWCYTLDPHTRWEYCAI f [2-8 0 .' fil^ilss^ 



AAAACATGCGCTGACAATACTATGAATGACACTGATGTTCCTTTGGAAACAACTGAATGC 

+ + + + + + 

TTTTGTACGCGACTGTTATGATACTTACTGTGACTACAAGGAAACCTTTGTTGACTTACG 



841 

281 KTC ADMTMNDT DV PLET T 



E C 



ATCCAAGGTCAAGGAGAAGGCTACAGGGGCACTGTCAATACCATTTGGAATGGAATTCCA 

901 + + + + + + 960 

TAGGTTCCAGTTCCTCTTCCGATGTCCCCGTGACAGTTATGGTAAACCTTACCTTAAGGT 

301 IQGQGEGYRGTVNTIWNGI? 320 



961 
321 



TGTCAGCGTTGGGATTCTCAGTATCCTCACGAGCATGACATGACTCCTGAAAATTTCAAG 

+ + + + + + 

ACAGTCGCAACCCTAAGAGTCATAGGAGTGCTCGTACTGTACTGAGGACTTTTAAAGTTC 



CQRWDSQYPHEHDMT PEN 



K 



1020 
340 



TGCAAGGACCTACGAGAAAATTACTGCCGAAATCCAGATGGGTCTGAATCACCCTGGTGT 

1021 + + + + + + 1080 

ACGTTCCTGGATGCTCTTTTAATGACGGCTTTAGGTCTACCCAGACTTAGTGGGACCACA 

341CKDLRENYCR MPDGSESPWC 3 60 



1081 
361 



TTTACCACTGATCCAAACATCCGAGTTGGCTACTGCTCCCAAATTCCAAACTGTGATATG 

+ + + + + + 

AAATGGTGACTAGGTTTGTAGGCTCAACCGATGACGAGGGTTTAAGGTTTGACACTATAC 



FTT DPNIRVGYCSQ 
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1261 
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1381 
461 
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1621 
541 
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531 



• • • • •••• 

• • • * • 

• • * « • • « * • 

(Fig. la continua) 

TCACATGGACAAGATTGTTATCGTGGGAATGGCAAAAATTATATGGGCAACTTATCCCAA 

-{ H + + h + 

AGTGTACCTGTTCTAACAATAGCACCCTTACCGTTTTTAATATACCCGTTGAATAGGGTT 
SHGQDCYRGNGKNYMGNLSQ 

ACAAGATCTGGACTAACATGTTCAATGTGGGACAAGAACATGGAAGACTTACATCGTCAT 

+ + + +■ + + 

TGTTCTAGACCTGATTGTACAAGTTACACCCTGTTCTTGTACCTTCTGAATGTAGCAGTA 

T R S G I; TCSMWDKNMEDLHRH 

ATCTTCTGGGAACCAGATGCAAGTAAGCTGAATGAGAATTACTGCCGAAATCCAGATGAT 
+ + + + + + 

TAGAAGACCCTTGGTCTACGTTCATTCGACTTACTCTTAATGACGGCTTTAGGTCTACTA 
I FWEPDASKLNENYCRNPDD 

GACGCTCATGGACCCTGGTGCTACACGGGAAATCCACTCATTCCTTGGGATTATTGCCCT 

+ + '- + H + + 

CTGCGAGTACCTGGGACCACGATGTGCCCTTTAGGTGAGTAAGGAACCCTAATAACGGGA 
DAHGPWCY'TGNPLI PWDYCP 

ATTTCTCGTTGTGAAGGTGATACCACACCTACAATAGTCAATTTAGACCATCCCGTAATA 

+ + + + + + 

TAAAGAGCAACACTTCCACTATGGTGTGGATGTTATCAGTTAAATCTGGTAGGGCATTAT 

I S RCEGDTT PT I VNLDHPVI 

TCTTGTGCCAAAACGAAACAATTGCGAGTTGTAAATGGGATTCCAACACGAACAAACATA 

+ + + + h + 

AGAACACGGTTTTGCTTTGTTAACGCTCAACATTTACCCTAAGGTTGTGCTTGTTTGTAT 

SCAKTKQLRVVNGI PTRTNI 

GGATGGATGGTTAGTTTGAGATACAGAAATAAACATATCTGCGGAGGATCATTGATAAAG 
■ h + + + h + 

CCTACCTACCAATCAAACTCTATGTCTTTATTTGTATAGACGCCTCCTAGTAACTATTTC 
GWMVSLRYRNKH ICGGSLI K 

GAGAGTTGGGTTCTTACTGCACGACAGTGTTTCCCTTCTCGAGACTTGAAAGATTATGAA 

+ + H + + + 

CTCTCAACCCAAGAATGACGTGCTGTCACAAAGGGAAGAGCTCTGAACTTTCTAATACTT 
ESWVLTARQCFPSRDLKDYE 

GCTTGGCTTGGAATTCATGATGTCCACGGAAGAGGAGATGAGAAATGCAAACAGGTTCTC 

+ + + + + + 

CGAACCGAACCTTAAGTACTACAGGTGCCTTCTCCTCTACTCTTTACGTTTGTCCAAGAG 

AWLGIHDVHGRGDEKCKQVL 
AATGTTTCCCAGCTGGTATATGGCCCTGAAGGATCAGATCTGGTTTTAATGAAGCTTGCC 

+ + + + h + 

TTACAAAGGGTCGACCATATACCGGGACTTCCTAGTCTAGACCAAAATTACTTCGAACGG 
MVSQLVYGPEGS DLVLMKL A 

AGGCCTGCTGTCCTGGATGATTTTGTTAGTACGATTGATTTACCTAATTATGGATGCACA 



• • • 



- + - 



TCCGGACGACAGGACCTACTAAAACAATCATGCTAACTAAATGGATTAATACCTACGTGT 
R.PAVLDDFVS TI DLPNYGCT 
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(Fig. la continua) 

ATTCCTGAAAAGACCAGTTGCAGTGTTTATGGCTGGGGCTACACTGGATTGATCAACTAT 

1801 + + + + + + 1860 

TAAGGACTTTTCTGGTCAACGTCACAAATACCGACCCCGATGTGACCTAACTAGTTGATA 

601 I PEKTSCSVYGWGYTGLINY 620 

GATGGCCTATTACGAGTGGCACATCTCTATATAATGGGAAATGAGAAATGCAGCCAGCAT 

1861 + + + + + + 1920 

CTACCGGATAATGCTCACCGTGTAGAGATATATTACCCTTTACTCTTTACGTCGGTCGTA 

621 DGLLRVAHLYIMGNEKCSQH 640 

CATCGAGGGAAGGTGACTCTGAATGAGTCTGAAATATGTGCTGGGGCTGAAAAGATTGGA 

1921 + + + + + + 1980 

GTAGCTCCCTTCCACTGAGACTTACTCAGACTTTATACACGACCCCGACTTTTCTAACCT 

641 HRGKVTLNES E I CAGAEK I G 660 

TCAGGACCATGTGAGGGGGATTATGGTGGCCCACTTGTTTGTGAGCAACATAAAATGAGA 

1981 + + + + + +• 2040 

AGTCCTGGTACACTCCCCCTAATACCACCGGGTGAACAAACACTCGTTGTATTTTACTCT 

661SGPCEGDYGGPLVCE QHKMR 68 0 

ATGGTTCTTGGTGTCATTGTTCCTGGTCGTGGATGTGCCATTCCAAATCGTCCTGGTATT 

2041 + + + + , + + 2100 

TACCAAGAACCACAGTAACAAGGACCAGCACCTACACGGTAAGGTTTAGCAGGACCATAA 

681 MVLGVIVPGRGCAI PNRPGI 700 

TTTGTCCGAGTAGCATATTATGCAAAATGGATACACAAAATTATTTTAACATATAAGGTA 

2101 + + + + + + 2160 

AAACAGGCTCATCGTATAATACGTTTTACCTATGTGTTTTAATAAAATTGTATATTCCAT 

701 FVRVAYYAKWI H KI ILTYKV 720 

CCATAGTCA TAG 

2161 2172 

GGTGTCAGTATC 

721 . P Q S * 723 
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ATGGGGTGGCTCCCACTCCTGCTGCTTCTGACTCAATGCTTAGGGGTCCCTGGGCAGCGC 
1 = + + + + + + 60 

TACCCCACCGAGGGTGAGGACGACGAAGACTGAGTTACGAATCCCCAGGGACCCGTCGCG 
1MGWLPLLLLLTQCLGVPGQR 20 

TCGCCATTGAATGACTTCCAAGTGCTCCGGGGCACAGAGCTACAGCACCTGCTACATGCG 

61 + + + + + + 120 ■ 

AGCGGTAACTTACTGAAGGTTCACGAGGCCCCGTGTCTCGATGTCGTGGACGATGTACGC 

21S PLNDFQVLRGTELQHLLHA 40 

GTGGTGCCCGGGCCTTGGCAGGAGGATGTGGCAGATGCTGAAGAGTGTGCTGGTCGCTGT 

121 + + + + + + 180 

CACCACGGGCCCGGAACCGTCCTCCTACACCGTCTACGACTTCTCACACGACCAGCGACA 

41VVPGPWQE DVADA.E ECAGRC 60 

GGGCCCTTAATGGACTGCCGGGCCTTCCACTACAACGTGAGCAGCCATGGTTGCCAACTG 

181 + + + + + + 240 

CCCGGGAATTACCTGACGGCCCGGAA.GGTGATGTTGCACTCGTCGGTACCAACGGTTGAC 

61GPLMDCRAFHYNVSS .HGC QL 80 

CTGCCATGGACTCAACACTCGCCCCACACGAGGCTGCGGCGTTCTGGGCGCTGTGACCTC 

241 + + + + + - + 300 

GACGGTACCTGAGTTGTGAGCGGGGTGTGCTCCGACGCCGCAAGACCCGCGACACTGGAG 

81LPWTQHSPHTRLRRSGRCDL 100 

TTCCAGAAGAAAGACTACGTACGGACCTGCATCATGAACAATGGGGTTGGGTACCGGGGC 

301 + + + + + + 360 

AAGGTCTTCTTTCTGATGCATGCCTGGACGTAGTACTTGTTACCCCAACCCATGGCCCCG 

101 FQKKDYVRTCIMNNGVGYRG 120 

ACCATGGCCACGACCGTGGGTGGCCTGCCCTGCCAGGCTTGGAGCCACAAGTTCCCGAAT 

361 + + + + + '+ 420 

TGGTACCGGTGCTGGCACCCACCGGACGGGACGGTCCGAACCTCGGTGTTCAAGGGCTTA 

121 TMATTVGGLPCQAWSHKFPN 140 

GATCACAAGTACACGCCCACTCTCCGGAATGGCCTGGAAGAGAACTTCTGCCGTAACCCT 

421 + + + + + + 480 

CTAGTGTTCATGTGCGGGTGAGAGGCCTTACCGGACCTTCTCTTGAAGACGGCATTGGGA 

141 DHKYTPTLRNGLEENFCRNP 160 

(continua) 
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GATGGCGACCCCGGAGGTCCTTGGTGCTACACAACAGACCCTGCTGTGCGCTTCCAGAGC 

481 + + + + + + 540 

CTACCGCTGGGGCCTCCAGGAACCACGATGTGTTGTCTGGGACGACACGCGAAGGTCTCG 

161 DGDPGGPWCYTTDPAVRFQS 180 

TGCGGCATCAAATCCTGCCGGGAGGCCGCGTGTGTCTGGTGCAATGGCGAGGAATACCGC 

531 + + + + + + 600 

ACGCCGTAGTTTAGGACGGCCCTCCGGCGCACACAGACCACGTTACCGCTCCTTATGGCG 

181CGIKSCREAACVWCNGEEYR 200 

GGCGCGGTAGACCGCACGGAGTCAGGGCGCGAGTGCCAGCGCTGGGATCTTCAGCACCCG 

601 ' + + + + + + 660 

CCGCGCCATCTGGCGTGCCTCAGTCCCGCGCTCACGGTCGCGACCCTAGAAGTCGTGGGC 

201 GAVDRTESGRECQRWDLQHP 220 



CACCAGCACCCCTTCGAGCCGGGCAAGTTCCTCGACCAAGGTCTGGACGACAACTATTGC 

+ + + + + + 

GTGGTCGTGGGGAAGCTCGGCCCGTTCAAGGAGCTGGTTCCAGACCTGCTGTTGATAACG 



661 

GTC 

221 H Q H 



PFEP GKFLDQG.LDDNYC 



720 
240 



CGGAATCCTGACGGCTCCGAGCGGCCATGGTGCTACACTACGGATCCGCAGATCGAGCGA 

721 + + + + + + 

GCCTTAGGACTGCCGAGGCTCGCCGGTACCACGATGTGATGCCTAGGCGTCTAGCTCGCT 

241 RNPDGSERPWC YTTDPQIER 

GAGTTCTGTGACCTCCCCCGCTGCGGGTCCGAGGCACAGCCCCGCCAAGAGGCCACAAGT ^ ^ 
781 CTCAAGACACTGGAGGGGGCGACGCCCAGGCTCCGTGTCGGGGCGGTTCTCCGGTGT|GA 
261 EFCDLPRCGSEAQPRQEAT Tf 

GTCAGCTGCTTCCGCGGGAAGGGTGAGGGCTACCGGGGCACAGCCAATACCACCACTGCG . . 

841 ■_+ + + + +- +'%?00 

CAGTCGACGAAGGCGCCCTTCCCACTCCCGATGGCCCCGTGTCGGTTATGGTGGTGACGC ------ 




281 VSCFRGKGEGYRG TANTTTA 



300 



901 
301 



GGCGTACCTTGCCAGCGTTGGGACGCGCAAATCCCGCATCAGCACCGATTTACGCCAGAA 

+ + + + + + 

CCGCATGGAACGGTCGCAACCCTGCGCGTTTAGGGCGTAGTCGTGGCTAAATGCGGTCTT 



GVPCQRWDAQI 



HQHRFTPE 



960 
320 



AAAT ACGCGTGCAAAGACCTTCGGGAGAACTTCTGCCGGAACCCCGACGGCTCAGAGGCG 

961 + + + + ;+ + 1020 

TTTATGCGCACGTTTCTGGAAGCCCTCTTGAAGACGGCCTTGGGGCTGCCGAGTCTCCGC 

321 KYACKDLRENFCRNPDGSEA 340 



1021' 
341 



CCCTGGTGCTTCACACTGCGGCCCGGCATGCGCGCGGCCTTTTGCTACCAGATCCGGCGT 

+ + + + + + 

GGGACCACGAAGTGTGACGCCGGGCCGTACGCGCGCCGGAAAACGATGGTCTAGGCCGCA 

P WC FT L RPGMRAA FCYQ I RR 



1080 
360 



TGTACAGACGACGTGCGGCCCCAGGACTGCTACCACGGCGCAGGGGAGCAGTACCGCGGC 

1081 + + + + + + • 11^0 

ACATGTCTGCTGCACGCCGGGGTCCTGACGATGGTGCCGCGTCCCCTCGTCATGGCGCCG 

361 C TDDVRPQDCYKGAGEQYRG 380 
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ACGGTCAGCAAGACCCGCAAGGGTGTCCAGTGCCAGCGCTGGTCCGCTGAGACGCCGCAC 

1141 + + + + + + 1200 

TGCCAGTCGTTCTGGGCGTTCCCACAGGTCACGGTCGCGACCAGGCGACTCTGCGGCGTG 

381 TVSKTRKGVQCQRWSAETPH. 400 



1201 
401 



AAGCCGCAGTTCACGTTTACCTCCGAACCGCATGCACAACTGGAGGAGAACTTCTGCCGG 
+ + + + + + 12 60 

TTCGGCGTCAAGTGCAAATGGAGGCTTGGCGTACGTGTTGACCTCCTCTTGAAGACGGCC 



K P Q F T 



TSEPHAQLEENFCR 



420 



AACCCAGATGGGGATAGCCATGGGCCCTGGTGCTACACGATGGACCCAAGGACCCCATTC 

1261 + + + + + + 1320 

TTGGGTCTACCCCTATCGGTACCCGGGACCACGATGTGCTACCTGGGTTCCTGGGGTAAG 

421 NPDGDSHGPWCYTMDPRTPF 440 

GACTACTGTGCCCTGCGACGCTGCGCTGATGACCAGCCGCCATCAATCCTGGACCCCCCA 

1321 + + + + + + 1380 

CTGATGACACGGGACGCTGCGACGCGACTACTGGTCGGCGGTAGTTAGGACCTGGGGGGT 

441 DYCALRRCADDQ P PS I' LDP P 460 

GACCAGGTGCAGTTTGAGAAGTGTGGCAAGAGGGTGGATCGGCTGGATCAGCGGCGTTCC 

1381 + + + + + + 1440 

CTGGTCCACGTCAAACTCTTCACACCGTTCTCCCACCTAGCCGACCTAGTCGCCGCAAGG 

461 DQVQFEKC.GKRVDRLDQRRS 480 

AAGCTGCGCGTGGTTGGGGGCCATCCGGGCAACTCACCCTGGACAGTCAGCTTGCGGAAT 

1441 + + + + + + 1500 

TTCGACGCGCACCAACCCCCGGTAGGCCCGTTGAGTGGGACCTGTCAGTCGAACGCCTTA 

481 KLRVVGGHPGNS PWTVSLRN 500 

" ' "" CGGCAGGGCCAGCATTTCTGCGGGGGGTCTCTAGTGAAGGAGCAGTGGATACTGACTGCC 

1501 ■ + + + -> + + 1560 

' . GCCGTCCCGGTCGTAAAGACGCCCCC.CAGAGATCACTTCCTCGTCACCTATGACTGACGG 

501 RQGQHFCGGSLV K ■'. E Q W I L T A 520 

CGGCAGTGCTTCTCCTCCTGCCATATGCCTCTCACGGGCTATGAGGTATGGTTGGGCACC 

1561 + + + + + + 1620 

GCCGTCACGAAGAGGAGGACGGTATACGGAGAGTGCCCGATACTCCATACCAACCCGTGG 

521 RQCFSSCHMPLTGYEVWLGT 540 

CTGTTCCAGAACCCACAGCATGGAGAGCCAAGCCTACAGCGGGTCCCAGTAGCCAAGATG 

1621 + + + + +- + 1680 

GACAAGGTCTTGGGTGTCGTACCTCTCGGTTCGGATGTCGCCCAGGGTCATCGGTTCTAC 

54 1LFQNPQHGEPSLQRVPVAKM 5 60 



1681 
561 



GTGTGTGGGCCCTCAGGCTCCCAGCTTGTCCTGCTCAAGCTGGAGAGATCTGTGACCCTG 

+ + + + '+ + 

CACACACCCGGGAGTCCGAGGGTCGAACAGGACGAGTTCGACCTCTCTAGACACTGGGAC 



VCGPSGSQLVLLKL 



R S V T L 



1740 
580 



1741 
581 



AACCAGCGTGTGGCCCTGATCTGCCTGCCCCCTGAATGGTATGTGGTGCCTCCAGGGACC 

+ + + + + + 

TTGGTCGCACACCGGGACTAGACGGACGGGGGACTTACCATACACCACGGAGGTCCCTGG 



NQRVALICLP? 



EWYVVPPGT 

( continu 
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(Fig. lb continua) 

AAGTGTGAGATTGCAGGCTGGGG^GAGACCAAAGGTACGGGTAA 186Q 
1801 i^ACACTCT AACGTCCGACCCCACT CT GGTTTCCATGCCCATTACTGTGTCAGGATTTA 
601KCEIAGWGETKGTGNDTVLN 620 

GTGGCCTTTCTGAATGTTATCTCCAACCAGGAGTGTAACATCAAGCAC^ 192Q 

1861 Eaccggaaagacttacaatagm 

621VAFLNVISN QECNIKHRGRV 640 



1921 



CGGGAGAGTGAGATGTGCACTGAGGGACTGTTGGCCCC 1980 
GCCCTCTCACTCTACACGTGACTCCCTGACAACCGGGGACACCCCCGGACACTCCCACTG 

641RESEMCTEGLLAPVGACEGD 660 

TACGGGGGCCCACTTGCCTGCTTTACCCACAACTGCTGGGTCCT 2Q40 
1981 ATGCCCCCGGGTGAACGGACGAAATGGGTGTTGACGACCCAGGACCTTC 
6 6l" YGGPLACFTHNCWVLEGIII 680 

CCCAACCGAGTATGCGCAAGGTCCCGCTGGCCAGCTGT^ 2100 
2041 GGGTTGGCTCATACGCGTTCCAGGGCGACCGGTCGACAGAA^ 
681PNRVCARSRWPAV 



F T R V S V F 



700 



GTGGACTGGATTCACAAGGTCATGAGACTGGGTTAG 



2101 



2136 



CACCTGACCTAAGTGTTCCAGTACTCTGACCCAATC 
701 VDWIHKVMRLG* 711 
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GAATTCCACCAT^GGGTGGCTCCCACTCCTGCTGCTTCTGACTCAATGCTTAGGGGTCCC ^ 



1 CTTAAGGTGGTACCCCACCGAGGGTGAGGACGACGAAGACTGAGTTACGAATCCCCAGGG 
1 MGWLPLLLLLTQCLGVP 

TGGGCAGCGCTCGCCATTGAATGACTTCCAAGTGCTCCGGGGCACAGAGCTAa 
6 1 ACCCGTCGCGAGCGGTAACTTACTGAAGGTTCACGAGGCCCCGTGTCTCGATGTCGTGGA 
18 GQRSPLNDFQVLRGTELQKL 

GCTACATGCGGTGGTGCCCGGGCCTTGGCAGGAGGATGTGGCAGATGCTGAAGAGT^ 

121 CGATGTACGCCACCACGGGCCCGGA 
38 LHAVVPGPWQEDVADAEECA 

TGGTCGCTGTGGGCCCTTAATGGACTGCCGGGCCTTCCACTACAACGTGAGCAGCCATGG 

i a._ — — — — — H r 



181 



ACCAGCGACACCCGGGAATTACCTGACGGCCCGGAAGGTGATGTTGCACTCGTCGGTACC 



G R C G 



MDCRAFHYNVSSK 



TTGCCAACTGCTGCCATGGACTCAACACTCGCCCCACACGAGGCTGCGGCGT^ 



AACGGTTGACGACGGTACCTGAGTTGTGAGCGGGGTGTGCTCCGACGCCGCAAGACCCGC 

HS P HT RLRRSGR 



.24: 

AACGGTTGACGACGGTACC 
7 8 CQLLPWTQ 

CTGTGACCTCTTCCAGAAGAAAGACTACGTACGGACCTGCATCATG 
301 GACACTGGAGAAGGTCTTCTTTCTGATGCATGCCTGGAC 
98 CDL FQKKDYVRTC I MNNGVG 

GTACCGGGGCA.CC ATGGCCACGACCGTGGGTGGCCTGCCCTGCCAGGCTTGGAG^ 
361 CATGGCCCCGTGGTACCGGTGCTGGCACCC 

118 YRGTMATTVGGLPCQAWSHK 

GTTCCCGAATGATCACAAGTACACGCCCACTCTCCGGAATGGCCTGGAAGAGAACTTCTG . 

j O 1 _ , — — — — — -|- — — — — — — — — -f- — — — — — — — — — -1 — — — — — — — —— H — — — — — +- 

CAAGGGCTTACTAGTGTTCATGTGCGGGTGAGAGGCCTTACCGGACCTTCTCTTGAAGAC 
138 FPNDHKYTPTLRNGLEENFC 

CCGTAACCCTGATGGCGACCCCGGAGGTCCTTGGTGCTACAC^ 
4 8 1 GGCATTGGGACTACCGCTGGGGCCTCCAGGAAC 

158 RNPDGDPGGPWCYTTDPAVR 

( continua ) 



17 

120 
37 

180 
57 

240 
77 

300 
97 

360 
117 

420 
137 

480 
157 

540 
177 
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541 
178 

601 
198 

661 
218 

721 
238 

781 
258 

841 
278 

901 
298 

961- 
318 

1021 
338 

108T 
358 

1141 
378 



CTTCCAGAGCTGCGGCATCAAATCCTGCCGGGAGGCCGCGTGTGTCTGGTGCAATGGCGA ^ 
GAAGGTCTCGACGCCGTAGTTTAGGACGGCCCTCCGGCGCACACAGACCACGTTACCGCT 
FQSCGIKSCREAACVWCNGE 197 



GGAATACCGCGGCGCGGTAGACCGCACGGAGTCAGGGCGCGAGTGCCAGCGCTGGGATCT 

+ + + + + + 

CCTTATGGCGCCGCGCCATCTGGCGTGCCTCAGTCCCGCGGTCACGGTCGCGACCCTAGA 

E Y R G A V- D R--T-- E -S G R E C Q R W D L 



660 
217 



TCAGCACCCGCACCAGCACCCCTTCGAGCCGGGCAAGTTCCTCGACCAAGGTCTGGACGA 

+ + + + + + 72U 

AGTCGTGGGCGTGGTCGTGGGGAAGCTCGGCCCGTTCAAGGAGCTGGTTCCAGACCTGCT 

QHPHQHPFEPGKFLDQGLDD 



237 



CAACTATTGCCGGAATCCTGACGGCTCCGAGCGGCCATGGTGCTACACTACGGATCCGCA 
GTTGATAACGGCCTTAGGACTGCCGAGGCTCGCCGGTACCACGATGTGATGCCTAGGCGT 
NY CRNPDGSERPWCYT TDPQ 



257 



GATCGAGCGAGAGTTCTGTGACCTCCCCCGCTGCGGGTCCGAGGCACAGCCCCGCCTCGA 

+ + + + + + a4U 

CTAGCTCGCTCTCAAGACACTGGAGGGGGCGACGCCCAGGCTCCGTGTCGGGGCGGAGCT 

IEREFCDLPRCGSEAQPRLE 277 



GGGCGGTGGCGGTTCTGGTGGCGGTGGCTCCGGCGGTGGCGGTTCTCTAGAGGGACAAAG 



900 



CCCGCCACCGCCAAGACCACCGCCACCGAGGCCGCCACCGCCAAGAGATCTCCCTGTTTC 
GGGGSG GGGSGGGG S LE GQR 297 

GAAAAGAAGAAATACAATTCATGAATTCAAAAAATCAGCAAAGACTACCCTAATC g g q 

CTTTTCTTCTTTATGTTAAGTACTTAAGTTTTTTAGTCGTTTCTGATGGGATTAGTTTTA 
KRRNTIHEFKKSAKTTLIKI 



AGATCCAGCACTGAAGATAAAAACCAAAAAAGTGAATACTGCAGACCAATGTGCTAATAG 
TCTAGGTCGTGACTTCTATTTTTGGTTTTTTCACTTATGACGTCTGGTTACACGATTATC 
DPALKIKTKKVNTADQCANR 

ATGTACTAGGAATAAAGGACTTCCATTCACTTGCAAGGCTTTTGTTTTTGXTAAAGC^ 
TACATGATCCTTATTTCCTGAAGGTAAGTGAACGTTCCGAAAACAAAAACTATTTCGTTC 
CTRNKGLPFTCKAFVFDKAR 



317 

1020 
337 

1080 
357 



AJW^CAATGCCTCTGGTTCCCCTTCAATAGCATGTCAAGTGGAGTGAAAAAAGAATTTGG 
TTTTGTTACGGAGACCAAGGGGAAGTTATCGTACAGTTCACCTCACTTTTTTCTTAAACC 
KQ CLWFPFNSMS SGVKKEFG 377 



CCATGAATTTGACCTCTATGAAAACAAAGACTACATTAGAAACTGCATCATTGGTAAAGG 

, — — 4- J____ _ _ — — — — — — — — — — — + — t — — —— — —— + 

GGTACTTAAACTGGAGATACTTTTGTTTCTGATGTAATCTTTGACGTAGTAACCATTTCC 
HEFDLYENKDYIRNCIIGKG 



1200 



397 
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(Fig. 2b continua) 

ACGCAGCTACAAGGGAACAGTATCTATCACTAAGAGTGGCAT ± 2 %Q 

1201 TGCGTCGATGTTCCCTTGTCATAGATAGTGATTCTCACCGTAG^ 
398 RSYKGTVSITKSGIKCQPWS 417 

TTCCATGATACCACACGAACACAGCTATCGGGGTAAAGACCTACAGGAAAACTACT 

1261 AAGGTACTATGGTGTGCTTGTGTCG 
413 SMIPHEHSYRGKDLQENYCR 437 

AAATCCTCGAGGGGAAGAAGGGGGACCCTGGTGTTTCACAAGCAATC^ i3gQ 
1321 XTTAGGAGCTCCCCTTCTTCCCCCTGGGACCACAAAGTGTTCGTTAGGTCTCCATGCGAT 
438 NPRGEEG-GPWCFTSNPEVRY 457 

CGAAGTCTGTGACATTCCTCAGTGTTCAGAAGTTGAATGCATGACCTGC 14 40 

1381 GCTTCAGACACTGTAAGGAGTCACAAGTCTTCAACTTACGTACTG 
458 EVCDIPQCSEVECMTCNGES 477 

TTATCGAGGTCTCATGGATCATACAGAATCAGGCAAGATTTGTCAGCGCTGGGA 

1441 AATAGCTCCAGAGTACCTAGTATGTCTTAGTCCGTTCT 

YRGLMDHTESGKICQ RWDHQ 4 97 



478 

1501 
498 

1561 
518 

1621 



GACACCACACCGGCACAAATTCTTGCCTGAAAGATATCCCGA^ ^ $ gQ 
CTGTGGTGTGGCCGTGTTTAAGAACGGACTTTCTATAGGGCTGTT 

TPHRHKFLPERYPDKGFDDN 517 

TTATTGCCGCAATCCCGATGGCCAGCCGAGGCCATGGTGCTATAC^ 162Q 

AATAACGGCGTTAGGGCTACCGGTCGGCTCCGGTACCACG ' 

YCRNPDGQPRP WCYT LDPHT 537 

CCGCTGGGAGTACTGTGCAATTAAAACATGCGCTGACAAAGCT 

GGCGACCCTCATGACACGTTAATTTTGTACGCGACTGTTTCGACTGCTGCTGCTGTTTG 

D*' K A D D D "D K H 557 



538 RWEYCAI KTCA 



CCACCACCACCACCACCACTAGGGTCGAC 

1681 + I 709 

GGTGGTGGTGGTGGTGGTGATCCCAGCTG 

558 H H H H H H * 563 
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Linker 



Tag 



SEQUENZA LEADER 



Kl K2 



Kl K2 



HGF 



HGF 



di 
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ggatccgccagcccgtccagcagcacca^gtgggtgaccaaac^ 6Q 

1 -~~±ZZZZ ;;ii^ m ^r T , r .^rp n £ n ^ r . f - n( ~ Tf :r.TTTGAGGACGGTCGGGACGAC 



CCTAGGCGGTCGGGCAGGTCGTCGTGGTACACCCACTGGTT1 

MWVTKLLPALL 



11 



CTGCAGCATGTCCTCCTGCATCTCCTCCTGCTCCCCATCGCCATCCCCTA^ ^ 
1 -mZrtrii:^^,^.^i.^n^Ar-^n^i-.iiGGGGTAGCGGTAGGGGATACGTCTCCCT 



GACGTCGTACAGGAGGACGTAGAGGAGGACGA 1 



P Y A E G 



12LQHVLLHLLLLPIAI 

CAAAGGAAAAGAAGAAATACAATTCATGAATTCAAAAAATCAGCAAAGACT ^ 
121 a^^E^SE^E^^MG^AAa^ACTTAAGTTTTTTAGTCGTTTCTGATGGGATTAG 
32 Q R K R R M T I H E F K K S A K T T L I 51 

AAAATAGATCCAGCACTGAAGATAAAAACCAAAAAAGTGAATACTGCAGA ^ 

1 8 1 Vttt It c't mctEct g^tct mottcg wttttcactt atgacgtctggttacacga 

52KIDPALKIKTKKVNTADQCA 71 



aatagatgtactaggaataaaggacttccattcacttgcaaggct^ 300 

2 4 1 TTATCTACATGATCCTTATTTCCTGA^ 

72NRCTRNKGLPFTCKAFVFDK 91 

GCAAGAAAACAATGCCTCTGGTTCCCCTTCAATAGC^TGTCAAGTGGMTG ^ 

1 --^^ACGGAaAScAAaaaGAAG^ATCGTACAGTTCACCTCACTTTTTTCTT 

S S G V K K E HI 



30 



CGTTCTTT 

92ARKQCLWFPFNSM 



TTTGGCCATGAATTTGACCTCTATGAAAACAAAGACTACATTAGAAACTGCATCATTGGT ^ 
361 LAAcEGaTAC^AAAC^aAGAmE^^G^TETGATGTAATCTTTGACGTAGTA^CCA 



112 F G H E 



FDLYEN KDY 



R N C 



I G 



131 



AAAGGACGCAGCTACAAGGGAACAGTATCTATCACTA^.GAGTGGCATCA^TGTCAGCCC ^ 
4 2 1 i^CC^E^CGAia^TEEc^a^A^aATAGTGATTCTCACCGTAGTTTACAGTCGGG 
132 K G R S Y K G T V S I T K S G I K C Q P 151 

TGG AGTTCCATGAT ACC AC ACGAAC AC AGCTATCGGGGT AAAGACCT ACAGG AAAACT AC g ^ q 
4 8 1 Icct c'aIg'gt act atg'gt G^TGTG^ CGAT AGCCCCATTTCTGGATGTCCTTTTGATG 
152 W S SMI PHEHSYR G . K D L Q E N Y 171 

/' ( continua ) 

/ ; _ . 
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(Fig. 3b continua ) 

TGTCGAAATCCTCGAGGGGAAGAAGGGGGACCCTGGTGTTTCACAAGCAATC^ goo 

541 ACAGCTTTAGGAGCTCCCCTTCTTCCCCCTGG^ ' 
172CRNPRGEEGGPWCFTSNPEV 191 

CGCTACGAAGTCTGTGACATTCCTCAGTGTTCAGAAGTTGAA^ 66Q 
601 GCGATGCTTCAGACACTGTAAGGAGTCACAAG^ 

192RYEVCDIPQCSEVECMTCNG 211 

GAGAGTTATCGAGGTCTCATGG ATCAT ACAGAATCAGGC ? 2 Q 

661 Etctcaatagctccagagtacctagtatgtcttag^ 

212ESYRGLMDHTESGKICQRWD 231 

catcagacaccacaccggcacaaattcttgcctgaaagat atcccgacaagggctttgat ^ g o 
721 gtagtctgtggtgtggccgtgtttaagaacggact^ 

232 HQTP HRHKFLPERYPDKGFD 251 

GATAATTATTGCCGCAATCCCGATGGCCAGCCGAGGCCATGGTGC^ 8 4 0 

7 8 1 Etattaataacggcgttagggct^ 

252 DNYCRNPDGQPRPWCYTLD P 271 

cacacccgctgggagtactgtgcaattaaaacatgcgctgacaa^ 90Q 
841 gtgtgggcgaccctcatgacacgttaattttgtacgcga 

272 H T R W E Y C A I K T C A D K A S G G G 291 

GGTTCTGGTGGCGGTGGCTCCGGCG^ 960 
901 CCAAGACCACCGCCACCGAGGC^ 

292 G S G G G G S G G G G S L E G Q R K R R 311 

AATACAATTCATGAATTCAAAAAATCAGCAAAGACTACCCTAAT^ 1Q2Q 
9 6 1 tTATGTTAAGTACTTAAGTTTTTTA 

312NTIHEFKKSAKTTLIKIDPA 331 

CTGAAGATAAAAACCAAAAAAGTGAATACTGCAdACCAATG^ 1080 

1021 GACTTCTATTTTTGGTTTTTTCACTTATC 
332 LKIKTKKVNTADQCANRCTR 351 

AATAAAGGACTTCCATTCACTTGCAAGGCTTTTGTTTTTGATAAAGCAAGAAAA H40 

1081 ^ATTTCCTGAAGGTAAGTGAACGTTCCGA^ 
352 NKG .LPFTCKAFVFDKARKQC 371 

CTCTGGTTCCCCTTCAATAGCATGTCAAGTGGA^ 12QQ 

1141 GAGACCAAGGGGAAGTTATCGTACAG^ 
372 LWFPFNSMSSGVKKEFGHEF 
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(Fig. 3b continua) 

GACCTCTATGAAAACAAAGACTACATTAGAAA.CTGCATCATTGGTAAAGGACGCAGCTAC 

1201 CTGGAGATACTTTTGTTTCTGATGTAAT^ 
392 DLYENKDYIRNCIIGKGRSY 411 

AAGGGAAC AGT ATCTATCACT AAGAGTGGCATCAAATGTC AGCCCTGGAGTTCCATG ATA ^ q 

1261 TTCCCTTGTCATAGATAGTGATTCT 
412KGTVSITKSGIKCQPWSSMI 431 

CCACACGAACACAGCTATCGGGGTAAAGACCTACAGGAAAA^ 1380 

1321 GGTGTGCTTGTGTCGATAGCCCCA 
432 PHEHSYRGKDLQENYCRNPR 451 

GGGGAAGAAGGGGGACCCTGGTGTTTCACAAGCAATCCAGAGGTACGC^ 14 4 0 

1381 ECCCTTCTTCCCCCTGGGACCACAAA 
452 GEEGGPWCFTSNPE VRYEVC 471 

GACATTCCTCAGTGTTCAGAAGTTGAATGCATGACCTGCAATGGGGAG^ 150Q 

1441 CTGTAAGGAGTCACAAGTCTTCAACTT 
472 DIPQCSEVECMTCNGESY. RG 491 

CTCATGGATCATACAGAATCAGGCAAGATTTGTCAGCGCTGG^ ± 5 g Q 

1501 GAGTACCTAGTATGTCTTAGTCCGTTCTAAACAGTCGC 
492 LMDHTESGKICQRWD HQTPH 511 

■ : CGGCACAAATTCTTGCCTGAAAGATATCCCGACAAGGOT 162Q 

1561 ','gccgtgtttaagaacggacS 

512 ;r H K F L P E R Y P D K G- F D D N Y C R 531 

aatcccgatggccagccgaggccatggtgctatactcttgaccc^ 16QQ 
1621 ttagggctaccggtcggctccggtac^ 

532 N P D G Q P R P W C Y L D P H T R W E 551 

tactgtgcaattaaaacatgcgctgacaaagctgacg^ 17 4 0 

1 68 1 atgacacgttaattttgtacgcgactg^ 

552 YCAIKTCAD KADDDOKHHHH 571 

caccaccactagggtcgac 

1741- — 1759 

gtggtggtgatcccagctg 

572 H H H * 574 
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